Classifier performance

F-measure

F measure是用來評估分類標準表現好壞的指標之一,考量precision和recall並整合為單一指標。特別適用在樣本分佈不平衡(某一類別的樣本數遠少於另一類別)時,它可以提供比單純使用precision或recall更可靠的指標。與area under curve (AUC)相比,AUC著重在分類的正確率(accuracy)。

F measure為precision與recall的調和平均(harmony mean),調和平均數比算術平均數更受小數值的影響(也就是調和平均數通常會比算數平均數來得小)。在confusion matrix當中,通常precision較大時,recall的值會較小。

相關筆記